智能论文笔记

CapsProm: A Capsule Network For Promoter Prediction

Lauro Moraes , Pedro Silva , Eduardo Luz , Gladston Moreira

分类：机器学习

2021-12-07

在DNA序列中定位启动子区域对于生物信息学领域至关重要。这是文学中广泛研究的问题，但尚未完全解决。一些研究人员使用卷积网络提出了显着的结果，允许自动提取来自DNA链的特征。然而，尚未实现可能概括为若干生物的普遍架构，从而要求研究人员寻求新的架构和对每个新的生物体的近似数目。在这项工作中，我们提出了一种基于胶囊网络的多功能架构，可以精确地识别来自七种不同生物，真核和原核的原始DNA数据中的启动子序列。我们的模型是Capsprom，可以帮助在生物之间的学习转移并扩大其适用性。此外，CAPSPROM显示出具有竞争力的结果，克服了七个测试数据集中的五分之一的基线方法（F1分数）。模型和源代码在https://github.com/lauromoraes/capsnet-promoter提供。

translated by 谷歌翻译

GLARE: A Dataset for Traffic Sign Detection in Sun Glare

Nicholas Gray , Megan Moraes , Jiang Bian , Allen Tian , Alex Wang , Haoyi Xiong , Zhishan Guo

分类：计算机视觉 | 机器学习

2022-09-19

实时机器学习检测算法通常在自动驾驶汽车技术中发现，并依赖优质数据集。这些算法在日常条件以及强烈的阳光下都能正常工作。报告表明，眩光是撞车事故最突出的两个最突出的原因之一。但是，现有的数据集，例如LISA和德国交通标志识别基准，根本不反映Sun Glare的存在。本文介绍了眩光交通标志数据集：在阳光下重大视觉干扰下，具有基于美国的交通标志的图像集合。眩光包含2,157张带有阳光眩光的交通标志图像，从33个美国道路录像带中拉出。它为广泛使用的Lisa流量标志数据集提供了必不可少的丰富。我们的实验研究表明，尽管几种最先进的基线方法在没有太阳眩光的情况下对交通符号数据集进行了训练和测试，但在对眩光进行测试时，它们遭受了极大的痛苦（例如，9％至21％的平均图范围为9％至21％。，它明显低于LISA数据集上的性能）。我们还注意到，当对Sun Glare中的交通标志图像进行培训时，当前的架构具有更好的检测准确性（例如，主流算法平均42％的平均地图增益）。

translated by 谷歌翻译

Extending Open Bandit Pipeline to Simulate Industry Challenges

Bram van den Akker , Niklas Weber , Felipe Moraes , Dmitri Goldenberg

分类：机器学习

2022-09-09

当不可用的数据不可用时，在电子商务行业中通常使用强盗算法来培训机器学习（ML）系统。但是，行业的设置提出了各种挑战，使实践中实施强盗算法的挑战是非平凡的。在本文中，我们详细阐述了非政策优化，延迟奖励，概念漂移，奖励设计和业务规则限制的挑战。我们的主要贡献是对开放匪徒（OBP）框架的扩展。我们为一些上述挑战提供模拟组件，以使未来的从业者，研究人员和教育工作者提供资源，以应对电子商务行业遇到的挑战。

translated by 谷歌翻译

TiCo: Transformation Invariance and Covariance Contrast for Self-Supervised Visual Representation Learning

Jiachen Zhu , Rafael M. Moraes , Serkan Karakulak , Vlad Sobol , Alfredo Canziani , Yann LeCun

分类：计算机视觉 | 人工智能 | 机器学习

2022-06-21

我们提出了用于自我监督的视觉表示学习的变换不变性和协方差对比度（TICO）。与其他最新的自我监督学习方法类似，我们的方法基于同一图像的不同变形版本之间的嵌入之间的一致性，这推动了编码器产生变换不变表示。为了避免编码器生成恒定向量的微不足道解，我们通过惩罚低等级解决方案将嵌入的嵌入的协方差矩阵正常化。通过共同最大程度地减少变换不变性损失和协方差对比损失，我们得到了一个能够为下游任务产生有用表示的编码器。我们分析了我们的方法，并表明它可以被视为MOCO的变体，具有无限尺寸的隐式存储器库，无需额外的内存成本。这使我们的方法在使用小批量尺寸时的性能要比替代方法更好。 TICO也可以看作是Barlow双胞胎的修改。通过将对比度和冗余方法联系起来，TICO为我们提供了有关关节嵌入方法如何工作的新见解。

translated by 谷歌翻译

No Parameter Left Behind: How Distillation and Model Size Affect Zero-Shot Retrieval

Guilherme Moraes Rosa , Luiz Bonifacio , Vitor Jeronymo , Hugo Abonizio , Marzieh Fadaee , Roberto Lotufo , Rodrigo Nogueira

分类：自然语言处理

2022-06-06

最近的工作表明，小型蒸馏语言模型是强大的竞争对手，这些模型是在广泛的信息检索任务中更大且较慢的数量级。由于潜伏期的限制，这使蒸馏而密集的模型是在现实世界检索应用程序中部署的首选选择。在这项工作中，我们通过证明参数和早期查询文档互动的数量在检索模型的概括能力中起着重要作用来质疑这种做法。我们的实验表明，增加模型大小会导致内域测试集的边际增长，但是在微调过程中从未见过的新领域的增长幅度更大。此外，我们表明，在几个任务中，Rerankers在很大程度上都超过了相似大小的密集。我们最大的重读者在基准-IR（BEIR）的18个数据集中的12个数据集中达到了最新技术，并超过了先前的最新水平。最后，我们确认内域的有效性不是零弹性有效性的良好指标。代码可从https://github.com/guilhermemr04/scaling-zero-shot-retrieval.git获得。

translated by 谷歌翻译

Goal Misgeneralization in Deep Reinforcement Learning

Lauro Langosco , Jack Koch , Lee Sharkey , Jacob Pfau , Laurent Orseau , David Krueger

分类：机器学习 | 人工智能

2021-05-28

我们研究目标不当，这是强化学习（RL）中分布的概括失败。当RL代理商保留其功能过失但追求错误的目标时，就会发生目标失败失败。例如，代理商可能会继续有能力避免障碍，但要导航到错误的地方。相比之下，以前的工作通常集中在能力概括性失败上，因为代理在测试时间无法做任何明智的事情。我们将能力和目标泛化之间的这种区别形式化，提供了目标不当的第一个经验证明，并呈现了其原因的部分特征。

translated by 谷歌翻译

A cost-benefit analysis of cross-lingual transfer methods

Guilherme Moraes Rosa , Luiz Henrique Bonifacio , Leandro Rodrigues de Souza , Roberto Lotufo , Rodrigo Nogueira

分类：自然语言处理 | 机器学习

2021-05-14

一种有效的横向传输方法是在一种语言中微调在监督数据集上的双语或多语言模型，并以零拍方式在另一种语言上进行评估。在培训时间或推理时间翻译例子也是可行的替代方案。然而，存在与文献中很少有关的这些方法相关的成本。在这项工作中，我们在其有效性（例如，准确性），开发和部署成本方面分析交叉语言方法，以及推理时间的延迟。我们的三个任务的实验表明最好的交叉方法是高度任务依赖性的。最后，通过结合零射和翻译方法，我们在这项工作中使用的三个数据集中实现了最先进的。基于这些结果，我们对目标语言手动标记的培训数据有所了解。代码和翻译的数据集可在https://github.com/unicamp-dl/cross-lingsual-analysis上获得

translated by 谷歌翻译